查看原文
其他

SDXL 0.9 和 Midjourney 5.2 出图谁更好用 ? 深度比较 一文了解 !

行小曦 曦语子 2024-06-01

点击上面蓝色字体关注 设为星标



小版本更新迭代的加速,这也预示着AI 工具混战的加速。但是对于用户是好事情,有竞争才有进步嘛。StabilityAI 和 Midjourney 可谓是暗自较劲。除此之外还有Playground AI、GoogleBard、Adobe Firefly等等至少有30多个工具在加速跑。


可以说是不只是各行各业,现在的AI工具也在卷,抢占市场和占有率,你有的功能我要有,你没有的我也要有,而且比你的更好用。目测也许7月份将是各类AI工具一个更新迭代的大月份。用户静需等待就好。


Midjourney v6、

SDXL v 1.0、

Google StyleDrop、

DragGan、

Google Bard+ AdobeFirefly、



SDXL v0.9  VS  Midjourney 5.2 :



下面就几个用户吐槽的问题和改进的功能点,

还有商业应用上案例来整体比较看看:




左边:Stable Diffusion XL (SDXL) v0.9

右边:Midjourney 5.2


 旧版本出图过程中用户需要输入特定关键词   
 才能实现的全身像或者图像的扩充        
 现在可以一键缩放扩充图像内容         
 提升图像创意想象空间操控性                  

很多用户抱怨的两个点:一个是手的不稳定,手臂手指凌乱,一个是裁切的画面不完善,还有一个就是连续性的创作主题不稳定,就算是用seed值或者iw参数也不稳定:

在设计/出图/大场景方面,AI会裁切掉过多的画面,人物或者物体也需要输入特定的关键词,多次实验后逐步完善才可以得到完成的场景。而缩小功能的加入彻底改变这一情况。


Midjourney V5.2 :
虽说是小版本的迭代,但是为了提高用户的体验感受,为了更好方便用户扩充图像和想象空间。

MJ 在用户的操控性创意性上入手,缩放功能的加入可以更加自如控制画面。同时引入了新的美学系统、更高更好的清晰度,高变化模式。


Stable Diffusion XL (SDXL) v0.9 :
提升图像超真实感,同时也提升了输出分辨率,在复杂度和视觉质量方面超越了之前的迭代。

SDXL 0.9 还支持除简单文本提示之外的多种功能。其中包括图像到图像提示(输入一个图像以获取该图像的变体)、修复(重建图像的缺失部分)和修复(构建现有图像的无缝扩展)。


因此:图像放大缩小扩充两者都可以实现。



MJ 5.2 缩放功能= adobe firefly 自动填充功能。


MJ 5.2 在 / --NIJI 模式下,

同时+ 缩小功能可以得到,

更为震撼的新海诚/宫崎骏/风格大场景:



 用户抱怨最多的问题                 
 面条手/薛定谔的手的问题       


Stable Diffusion XL (SDXL) v0.9 :
随着大量的模型数据的增加,深度学习的性能也在增强,小版本的迭代也在逐步修复这个问题,是调教修复人物和动物手的问题,不会经常产生那些讨厌的“面条手或奇形怪状的多手指”。这也是用户抱怨最多的问题之一。


而在Midjourney V5.2中:
Midjourney 对于人物手臂和手的细节问题,目前还看不到明显的改变,又或者是我们就等待V6大版本的迭代,再看它的效果,加入Draggan功能的大迭代。

吐槽最多的手的问题:SD可通过插件可以逐渐修正,而MJ目前还看到太多的改进。


扩展阅读:
Midjourney V6马上来了 !
三个强大新功能 将颠覆AI绘图 !


薛定谔的手指,
数数看到底有多少个手指!


左图:Stable Diffusion XL (SDXL) v0.9

右图:Midjourney 5.2



 人物写实风格上的差异      
 开源 + 插件的应用            

在人物写实风格的比较上,开源的Stable Diffusion 明显好于 Midjourney,景深深度合成方面Stable Diffusion 更胜一筹。

像Stable Diffusion 的插件Controlnet 常被用于人像生成中引导手部生成使用。可以很好的解决大型开源模型的某些细节问题。

而Midjourney似乎更倾向于创意灵感的发挥。也不是说MJ不适合做人物,niji模式下Mj也可以做到快速生成某些风格。



 人物写实风格上的差异      
 开源 + 插件的应用            


在人物写实风格的比较上,开源的Stable Diffusion 明显好于 Midjourney,景深深度合成方面Stable Diffusion 更胜一筹。

像Stable Diffusion 的插件Controlnet 常被用于人像生成中引导手部生成使用。可以很好的解决大型开源模型的某些细节问题。

而Midjourney似乎更倾向于创意灵感的发挥。也不是说MJ不适合做人物,niji模式下Mj也可以做到快速生成某些风格。


>> 下图:

左手是正常的,右手还是薛定谔:




 商业化应用到底谁好?     

 人物、创意、各有春秋、         


现在随着AI的应用越来越广,
越来越多的店铺采用“AI人”展示店铺服装商品。

而这一方面SD也是更甚一筹。在人物稳定性上,Stable Diffusion 也是更胜一筹。SD在做写实人物方面本身就具有优势。依靠稳定的模型参数直接出成套的图,换产品比较方便。

而Mj连续创作上就非常不稳定,尤其是人物偶尔还会发生“变异”。简单的换衣还是可以完成的。但是MJ在创意方面确实很不错,尤其是广告美术设计墙绘电商服装出版刊物、室内设计等等50几个行业已经有了很大的影响力。






>> 上图:注意看敦煌飞天的手。
图:ChatAiRen

 AI 敦煌小姐姐的魔法咒语:   
 Prompt TXT2IMG        

1 girl,dunhuang_cloths,dunhuang_style,best quality, realistic, photorealistic, award-winning illustration, (intricate details:1.2), (delicate detailed), (intricate details), (cinematic light, best quality Backlights), clear line,fashion girl, sharp focus, realistic face,detailed face,official art, unity 8k wallpaper, ultra high res, (photorealistic:1.5), looking at viewer, ulzzang-6500 <lora:style_dunhuang:1> <lora:koreandolllikenessV20_v20:1>


Negative prompt: blurry background,depth of field,paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, age spot, (outdoor:1.6), manboobs, backlight, double navel, mutad arms, hused arms

Size: 512x768, 

Seed: 310006196, 

Model: chilloutmix_NiPrunedFp32Fix, 

Steps: 40, 

Sampler: DPM++ SDE Karras, CFG scale: 7, 

Model hash: fc2511737a, Hires upscale: 2, 

Hires upscaler: R-ESRGAN 4x+, 

Face restoration: CodeFormer, 

Denoising strength: 0.1




Stable Diffusion SDXL 0.9:

增强提示感知改善图像细节。

图像更为高清。


Midjourney 5.2:

如Outpainting、/shorten 缩放命令、

图像和背景的融合等等(写实风格)


SDXL 0.9 由两个 CLIP 模型提供支持,其中包括迄今为止训练的最大的 OpenCLIP 模型之一 (OpenCLIP ViT-G/14),它增强了 0.9 的性能和能力,以创建具有更多深度和更高分辨率的 1024× 的逼真图像1024。





上图:Stable Diffusion XL (SDXL) v0.9

下图:Midjourney 5.2


蜜蜂从绿色植物围绕的玻璃罐中飞出,
玻璃和镜头光晕,漫射照明优雅”







与此同时,Stability AI 继续与另外两个项目一起开发模型:一个名为 StableLM 的灵活大语言模型 (LLM) 和令人印象深刻的 DeepFloydIF,这是一种先进的文本到图像生成器,有助于将清晰的文本嵌入到图像中。

据 Stability AI 称,这一改变游戏规则的模型预计将于 7 月中旬作为开源软件公开发布,这是该公司的另一个重要里程碑。


--- --- 


>> AI人物 如有雷同 实属巧合。

     喜欢这篇文章可以 - 点赞 在看 转发 :


GPT4 通过MBA 律师 医疗考试:

AI 和人类疯狂内卷开始!哪些人会最先卷出局 ?



强大 Google音乐AI 实测, 一键出音乐和歌曲, 

人人成为“音乐家”的时代来了 ?


AI复原的上古奇书《山海经》, 
再现中国人独有的浪漫和幻想!


>> AI 绘千年敦煌壁画大唐飞天 !



2500年前群星闪耀的时代,
“诸子百家”“春秋战国”。

--------------------------------------------

近期科普热文:

AI和人类的疯狂内卷,哪些人会提前出局?

25号宇宙预示了人类未来的结局?

GPT-5或推出具有仿人意识机器人!

GPT参加高考拿到高分清北指数日可待?

AI能代替人类的哪些工作?

2023 AI混战拉开第四个工业革命序幕?

我们只是一串代码?

现代版的西部世界体验来了!

人类意识永生不是梦!

AI预测未来地球面临的10大问题!

网红制作1000个AI替身年入4亿。

AI孙燕姿火爆 Google音乐AI一键出音乐。


AI遇上中国风:

AI复原“山海经”中国人独有的浪漫和幻想!

西王母昆仑神树上古华夏文明AI神奇还原!

AI画出“西游记 - 神迹的传说”。 

AI还原郑和下西洋!


继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存